qat

深度学习模型量化技术简介

量化(Quantization)是指将连续的高精度数值映射到离散的低精度数值的过程。量化是一种深度学习模型优化技术,它通过将模型的权重和激活值从高精度(如32位浮点数)转换为低精度(如8位整数或更低),从而减少模型的计算复杂度和存储需求,同时提高推理速度。这种

模型 学习 技术 深度学习 qat 2025-10-13 04:42  4